当缺乏完善的自适应学习系统时,我该如何学习任意一门学科?

原文:How I Would Go About Learning an Arbitrary Subject Where No Full-Fledged Adaptive Learning System is Available - Justin Skycak

作者:Justin Skycak (@justinskycak),发表于 2024 年 11 月 26 日

我正在使用大语言模型(LLM)学习生物学。我的总体结论是:如果你单靠自学教科书就能实现长期且有效的学习,而唯一阻碍你学习新学科的仅仅是时间略有不足,那么,大语言模型或许能助你一臂之力,略微提升学习效率,从而能帮你下决心去学一些以前没时间学的东西。但是,绝大多数人,注意是绝大多数人,依然需要一个完善的学习系统。而且,即便是对那些符合前述「如果」条件的极少数人来说……无论大语言模型相较于标准教科书能带来多大的效率提升,一个完善的学习系统对比大语言模型所能带来的效率提升,其程度甚至要大得多。


在最近的一期播客节目中,Zander 问我会如何着手学习一门全新的、任意的学科。

我经常被问到这个问题,但它确实有些棘手,所以我直到现在才真正尝试去回应。

我的思路主要集中在这样一个观点上——即便你深刻理解学习的原理以及哪些练习方法行之有效——问题的症结,那个更不受你掌控的部分,在于找到一套优质的课程体系。

最理想的情况是,有一个既严格又全面的自适应学习系统——然而在大多数学科中,这样的系统似乎尚未出现。诚然,我们有 Math Academy 这样的例子……但如果你想学,比如说,生物学呢?你该去哪里找?

去年我确实为此进行过一番调研,因为我想强化一下自己的生物学知识(这样我就能和我的妻子进行更深入的交流,她是一名攻读免疫学/生物信息学专业的研究生)。但我发现,除了各种教材和以讲座为基础的课程外,几乎找不到其他途径。

请别误解我的意思,依靠教材自学是完全可行的——事实上,我所掌握的大部分数学知识都是这样学来的——但是,天呐,跟一个优质的自适应学习系统比起来,这种方式的效率简直低得令人发指。也正是这种低效率,让我迟迟未能下定决心去学习生物学。

因此,在那期播客节目中,我们聊到了尝试利用大语言模型来模拟一个自适应学习系统的想法。

这个想法的核心在于——尽管这种模拟系统或许比不上那些由专业公司倾力打造的系统——但如果你能为其提供大量关于高效学习原理的背景知识,并且在必要时及时纠正其教学决策上的偏差,或许最终能得到一个还凑合的学习系统,至少比传统的教材要高效一些。

高效到足以让我真正下定决心去学习生物学。

阶段 #1

我把 Math Academy Way 的 PDF 文件丢给 GPT-4o,同时附上了以下提示词:

「我希望能扎实地掌握生物学领域的基础知识。请您担任我的生物学辅导老师,并使您的教学方法与附件中概述的高效学习原则保持一致。我计划在一周中的大部分日子里,每天抽出 20-30 分钟接受辅导,我希望你能在这些时段内,帮助我尽可能多地学习核心生物学知识。我不在乎过程是轻松愉快还是枯燥乏味,我唯一关心的是以尽可能高效的方式提升我的生物学知识水平。不必刻意追求互动性,也不必顾及我的感受,只要让我以严谨且尽可能高效的方式学会这些知识。」

结果其实相当不错。算不上惊艳,但已经好到让我觉得这样的学习体验足够高效,足以促使我下定决心,在一周中的大部分日子里每天花 20-30 分钟学习生物学。

(Zander 曾推荐我使用 Claude,而且我知道这是眼下 X/Twitter 上流行的建议,但是 Claude 说 Math Academy Way 的 PDF 文件大小是规定上限的 6 倍,要求我把它分割成 6 个独立的文件,所以我干脆就想,管它呢,我就用 ChatGPT 得了。或许等我把学习生物的习惯稍微培养起来一点后,会转过去试试 Claude。)

即便在提供了主要提示词以及 Math Academy Way 的 PDF 文件之后,我仍然需要就一些教学方法上的问题对 ChatGPT 进行纠偏,引导它走上正轨,之后它才开始良好运作,足以让我真正开始学习。

第一个挑战在于,当它开始问我一些诊断性问题时,所提的问题在我看来更像是些开放式的论述题。以下是我给出的纠正反馈:

「我的生物学基础非常薄弱,以至于我很难评估自己的知识水平,甚至都无法把自己所知道的东西有效地梳理并表达出来(brain dump)。你能否尽量让这个学习体验尽可能接近数学教学那样,专注于让我解决具体问题——或者至少,让我提供的答案范围比较具体?现在给我的感觉是,你像是在要求我写几篇小论文。」

这番沟通似乎比较有效地解决了提问的问题类型,可以继续了。但接下来的问题是,即使在它表示诊断阶段结束后,它仍然不停地问我问题,却没有呈现任何新的学习材料。我不得不明确要求它提供教学内容:

「请等一下。我们已经完成了诊断阶段,但你却还是一直在问我问题。这些问题大多远超我目前的知识边界。比如,我其实并不知道核糖体是什么。你告诉我它能组装蛋白质,但是……它究竟是什么呢?这感觉就像在我还不明白 8x3 等于 8+8+8 的时候,你就告诉我 8x3=24。我们能不能退一步,从基础开始逐步构建我的知识体系?这需要你向我传授新知识,而不仅仅是提问(尽管,对于你传授给我的任何新知识,我仍然需要通过回答问题来进行提取练习)。」

至此,它开始先提供简短的教学材料,然后提出问题,事情总算感觉对路了。

有一个小问题出在判断题上,这些题目本应用于提取练习,所以应该是填空题,我通过如下方式进行了修正:

「ChatGPT:判断对错:蛋白质由氨基酸组成。

我:对(这本应是一道填空题——你本该要求我回忆「氨基酸」这个词组))」

此后,如果我认为自己缺乏某些额外的前置知识,我也会在我的填空答案中加入补充反馈:

「ChatGPT:填空:核糖体利用储存在 ______ 中的氨基酸来构建蛋白质。

我:细胞质(但我不太明白氨基酸是如何从血液进入细胞的)」

这种方法似乎相当有效。

在整个大约 25-30 分钟的学习过程中,我回答了 18 个问题。其中大概有 10 分钟,我花在了提供指令和纠正性反馈上,以确保 ChatGPT 在教学方法上不偏离轨道。但我预计将来这方面花费的时间会减少。所以,我期望未来能达到大约每分钟回答一个问题的速度……这相当不错!

我把整个对话都复制到了一个文本文件中,这样下次我就可以提供这个文件(以及 Math Academy Way 的资料),让它从上次中断的地方继续学习。

  • 我还在文本文件中标注了日期,这样我就可以让它安排它认为我需要的任何间隔复习(我对这方面的期望不是特别高,但希望它至少能做到「还算可以」的程度,至少比标准教科书好得多)。

  • 很快,我还会让它就我目前学过的所有内容对我进行测验。

  • 我还打算咨询一下整体的学习路线图,看看它能否更详细地告诉我接下来生物学学习之旅中各个阶段的顺序(理想情况下,能为每个阶段提供某种形式的内容纲要)。

总的来说,我会说这种体验给人的感觉,明显比看教科书要高效得多——当然,肯定不如一个真正的自适应学习系统那么高效,但已经足以帮助我克服起步阶段的困难,开始着手巩固我的生物学基础了。

话虽如此——到目前为止,这些内容都是我曾经一度熟悉的(至少达到了能通过大学入门级生物学课程的程度),所以,当我从复习遗忘的知识过渡到学习全新的内容时,效果究竟如何还有待观察。学习全新的内容才是对教学方法的真正考验;而温习遗忘的知识,对于教学上的缺陷则有更强的包容性。

图片

阶段 #2

我再次把 MA Way 和上次会话的文字记录丢给它,并要求它安排一次新的学习环节,同时也包含一些间隔复习。

开局有些磕磕绊绊:

  1. 它试图让我复习一些它从未实际测试过我的内容,而且

  2. 它为了迎合它(错误地)揣测的我的兴趣点,规划出了一条低效的学习路径。

我用下面的提示词纠正了这些问题:

「在我们上次的会话中,你在阅读材料里提到过一两次「肽」(peptides),但从未真正要求我用这些信息解决问题。请只针对那些你之前让我解答过相关问题的信息进行间隔复习。

另外,我其实对消化系统不怎么感兴趣。上次我们之所以谈到一些消化方面的内容,是因为那是我缺失的一部分基础知识。如果你认为我需要继续补充这方面的知识,那没问题,但不要仅仅因为您觉得我对它本身很感兴趣(我并不)就围绕这个主题展开课程。我只想尽可能快速且高效地学习核心生物学知识。这真的是我唯一在乎的事情。不要试图根据你臆测的我的兴趣点来调整学习路径,除非我将来明确要求你这样做。我只想以最有效的方式尽快掌握所学内容。我唯一关心的是严格且高效地学习基础生物学。」

然后它开始问我希望如何进行这次学习,是直接深入新内容的细节,还是从一个宏观的概述开始。表面上看,这或许是个不错的问题——但别忘了,我只是个新手,我只想尽可能高效地学会这些东西。我不应该来做这些教学方法上的决定——这正是辅导老师的意义所在。我通过以下提示词传达了这一点:

「您就采用您认为能最快把这些知识塞进我脑子里的方法就行。如果你认为回顾更宏观的背景知识值得花时间,那可以,但如果你只是想对我温和一些,而这样做实际上并不值得所付出的机会成本,那我们就直接切入正题。你才是这方面的专家。」

在那之后,又出现了一个教学方法上的问题需要纠正:

「不不不,你这是想一次性塞给我太多东西了。你先让我阅读好几个不同主题的内容,然后就所有这些内容向我提问。请一步一步地引导我学习。我绝不希望你模仿教科书那种模式,让我先读一整章,然后再做一大堆习题。我希望阅读内容被拆分成连贯的小模块,并且与练习题交错进行。不要是 5 分钟阅读然后 5 分钟做题,而更应该是 1 分钟阅读然后 1 分钟做题,如此重复 5 次。让学习和练习的循环尽可能紧凑。」

然后,我又发现了一个知识缺口,不得不明确要求它为我补充,并且我得提醒它我上次纠正过的一个教学方法上的问题:

「1. RNA 聚合酶(但我不太明白你说它『读取特定基因』是什么意思,我不知道什么是酶,而且我也不太清楚基因在物理层面究竟是什么)

  1. 错误,它发生在细胞核内(请记住我上次跟你说过的,用填空题代替是非判断题)
  1. b

另外,你能不能一次只问我一个问题,而不是把三个问题合在一起问?」

我也开始有点受不了它啰嗦的风格了,于是我这样修正了它:

「谢谢,但我答对的时候,你不必重复我的答案。总的来说,你有点太啰嗦了,感觉像是在刻意讨好我,想让我感觉良好,我理解您的好意,但是……我真的不需要这些。我不想阅读任何与强化记忆无关的内容。请尽可能简洁扼要。你可以像一位不苟言笑的教官那样对我:直接告诉我该做什么,如果我做对了,就说声「正确」然后继续,不要重复我的答案,也不用告诉我我做得有多棒(再次感谢你的好意,但说到底,这些都只是增加了我的阅读量,却并不能真正帮我强化记忆)。

下一个问题的答案:胸腺嘧啶(T)」

总而言之,我今天并没有取得太大的进展。大部分时间都耗在努力把 ChatGPT 引导回正轨上了。

为了改善下次的情况,我打算把我给过 ChatGPT 的所有反馈意见都汇编起来,然后直接放进主提示词里。当然,所有这些内容都会记录在辅导日志的 PDF 文件中,但我可能需要把那些真正重要的反馈放在最核心、最显眼的位置。

图片

阶段 #3

第三轮学习取得了巨大进展!我终于找到了一种适合我长期坚持下去的学习节奏。

关键的诀窍在于——除了提供 MA Way 和之前的学习会话记录外——我还特地提醒了它我在先前会话中给出的那些至关重要的反馈。(今天也进行了一些微调,但都很快,而且是小问题。)

诚然,这种学习方式的效率远未达到 MA 的水准,并且即便如此,也需要一个经验丰富的「驾驶员」来掌控……但是,天啊,这比我找到的其他任何生物学学习资源都要高效得多。学习过程中的阻力已经大大减小,以至于学习生物学这件事终于让人感觉切实可行了。

以下是我迄今为止给它的所有关键反馈的汇总:

「我希望能扎实地掌握生物学领域的基础知识。请您担任我的生物学辅导老师,并使您的教学方法与附加文件中概述的高效学习原则保持一致。我计划在一周中的大部分日子里,每天抽出 20-30 分钟接受辅导,我希望你能在这些时段内,帮助我尽可能多地学习核心生物学知识。我不在乎过程是轻松愉快还是枯燥乏味,我唯一关心的是以尽可能高效的方式提升我的生物学知识水平。不必刻意追求互动性,也不必顾及我的感受,只要让我以严格且尽可能高效的方式学会这些知识。」

「我的生物学基础非常薄弱,以至于我很难评估自己的知识水平,甚至都无法把自己所知道的东西有效地梳理并表达出来(brain dump)。你能否尽量让这个学习体验尽可能接近数学教学那样,专注于让我解决具体问题——或者至少,让我提供的答案范围比较具体?现在给我的感觉是,你像是在要求我写几篇小论文。」

「请等一下。我们已经完成了诊断阶段,但你却还是一直在问我问题。这些问题大多远超我目前的知识边界。比如,我其实并不知道核糖体是什么。你告诉我它能组装蛋白质,但是……它究竟是什么呢?这感觉就像在我还不明白 8x3 等于 8+8+8 的时候,你就告诉我 8x3=24。我们能不能退一步,从基础开始逐步构建我的知识体系?这需要你向我传授新知识,而不仅仅是提问(尽管,对于你传授给我的任何新知识,我仍然需要通过回答问题来进行提取练习)。」

这本应是一道填空题,而不是是非判断题。

请务必提供任何你认为我到时候需要进行的间隔复习。但请只对那些你先前曾要求我解决过相关问题的信息进行间隔复习。

另外,我其实对生物学的任何特定分支领域都不怎么关心。不要仅仅因为您觉得我对某个主题本身很感兴趣(我并不)就把这节课的重点放在那上面。我只想尽可能快速且高效地学习核心生物学知识。这真的是我唯一在乎的事情。不要试图根据你臆测的我的兴趣点来调整学习路径,除非我将来明确要求你这样做。我只想以最有效的方式尽快掌握所学内容。我唯一关心的是严格且高效地学习基础生物学。

「您就采用您认为能最快把这些知识塞进我脑子里的方法就行。如果你认为回顾更宏观的背景知识值得花时间,那可以,但如果你只是想对我温和一些,而这样做实际上并不值得所付出的机会成本,那我们就直接切入正题。你才是这方面的专家。」

「不不不,你这是想一次性塞给我太多东西了。你先让我阅读好几个不同主题的内容,然后就所有这些内容向我提问。请一步一步地引导我学习。我绝不希望你模仿教科书那种模式,让我先读一整章,然后再做一大堆习题。我希望阅读内容被拆分成连贯的小模块,并且与练习题交错进行。不要是 5 分钟阅读然后 5 分钟做题,而更应该是 1 分钟阅读然后 1 分钟做题,如此重复 5 次。让学习和练习的循环尽可能紧凑。」

另外,你能不能一次只问我一个问题,而不是把三个问题合在一起问?

谢谢,但我答对的时候,你不必重复我的答案。总的来说,你有点太啰嗦了,感觉像是在刻意讨好我,想让我感觉良好,我理解您的好意,但是……我真的不需要这些。我不想阅读任何与强化记忆无关的内容。请尽可能简洁扼要。你可以像一位不苟言笑的教官那样对我:直接告诉我该做什么,如果我做对了,就说声「正确」然后继续,不要重复我的答案,也不用告诉我我做得有多棒(再次感谢你的好意,但说到底,这些都只是增加了我的阅读量,却并不能真正帮我强化记忆)。

这个问题提得不好,因为我很容易就想直接照抄上面的句子。你需要迫使我从记忆中提取信息,而不只是让我抄写。

我认为问题在于你提供的信息还不够,所以基于这些信息你能提出的唯一问题就显得无关紧要。我不希望您提供太多信息,但同时,你需要提供足够的信息来生成有意义的、能让我确实需要从记忆中提取信息的问题。我不希望能够轻易地通过上下文线索猜到答案,而没有经过应有的思考过程。

你正在进步,但这仍然不是一个好问题,因为我可以直接从你写的内容中复制粘贴来回答。作为一条通用准则,你需要问那些我无法直接复制粘贴答案的问题。

我需要的是恰到好处的信息平衡:信息不能太少,也不能太多;问题需要根据阅读信息就能直接回答,但我必须至少对信息进行相当程度的消化处理才能作答。

天啊,这个内容不错,但就是一次性给的信息太多了。看得我眼睛都花了。这些内容我都想掌握,但请你把它们分成大概两到三个更小的信息模块,在每个模块学习之后都问我一个问题,以确保我已充分理解和吸收。」

图片

总结与思考

我应该指出,这有点像一个「看似神奇的演示」,它看起来或许很酷、很有前景,但我运用了一个不易察觉的诀窍,使得在我这个特定的应用场景下,情况远比通常的现实要容易得多。

这个诀窍,也就是我的「独门秘方」,在于我持续不断地运用自己在高效学习方面的专业知识。我时刻通过提示词进行微调和校准,以确保与 AI 的对话保持在正确的教学轨道上。一旦我的行为举止更像一名普通学生,或者哪怕是一名认真学习但并非高效学习专家的学生,整个学习过程就会彻底跑偏。

这种跑偏并非总是瞬间发生。但它就像一种不断累积的偏差,如果没有持续的微调和校准,这种偏差最终会达到一个临界点,把你从正常的道路上引开,掉进沟里。

这确实是构建一个有效学习系统最艰难的部分——如何让学生始终保持在正确的学习路径上。大多数人对于有效培训究竟包含哪些要素并没有足够透彻的理解,因此无法亲自监督或管理整个学习过程。如果放任自流,并且给予他们足够的自主权,他们通常会把学习过程引向歧途,即便他们并非有意如此。

总的来说,我的结论是:

  • 如果你本身就能够通过长期自学教科书取得成功,而唯一阻碍你学习新知识的仅仅是时间上的一点点不足,

  • 那么,你或许可以利用大语言模型(LLM)的提示词功能来略微加速这一过程,这能帮你下定决心去学习一些你先前因时间不足而未能涉足的领域。

但是,这里的「如果」仅仅适用于极小一部分人。绝大多数人依然需要一个功能完善、体系健全的学习系统。

而且,即便是对于那一小部分符合「如果」条件的人而言……无论大语言模型的提示词功能相比传统教科书能带来多大的效率提升,一个完善的学习系统相比于大语言模型提示词功能所能带来的效率提升,其幅度都更为可观。